\section{初等因子}

\begin{frame}{初等因子}

在这一节与下一节中我们假定讨论中的数域 $P$ 是复数域。

\pause
上面已经看到， 不变因子是数字矩阵的相似不变量。 为了得到若尔当标准形， 再引入 $\lambda$-矩阵的第三种因子组：初等因子组。
我们先得说下多项式的初等因子。

\pause
\begin{definition}
若非常数多项式$h(\lambda)\in P[\lambda]$的标准分解为$h(\lambda)=c\prod_{i=1}^s p_i^{r_i}$, 
则$p_1^{r_1}, \cdots, p_s^{r_s}$称为$h(\lambda)$的\emph{初等因子} (elementary factor) 或\emph{准素因子} (primary factor)。
\end{definition}

\begin{example}
考虑多项式$h(\lambda)=2\lambda(\lambda+1)^2(\lambda^2+\lambda+1)^3$. 
 视$h(\lambda)$为有理系数多项式或实系数多项式时，
      $h(\lambda)$的初等因子为
        $\lambda$, $(\lambda+1)^2$, $(\lambda^2+\lambda+1)^3$;
      而视$h(\lambda)$为复系数多项式时，
      $h(\lambda)$的初等因子为
      $\lambda$, $(\lambda+1)^2$, $(\lambda+\frac{1+\sqrt{3}\mathrm{i}}{2})^3$, 
      $(\lambda+\frac{1-\sqrt{3}\mathrm{i}}{2})^3.$
\end{example}

\pause
我们接下来只关心$P=\bC$的情形, 这时不可约多项式都是一次的，标准分解形如
\[
  h(\lambda)=c\prod_{i=1}^s (\lambda-\lambda_i)^{r_i},
\]
其中$c\in \bC$, $\lambda_1,\cdots,\lambda_s\in \bC$互异，且$r_1,\cdots,r_s$为正整数。
这些$(\lambda-\lambda_i)^{r_i}$就是$h(\lambda)$的初等因子。

\end{frame}

\begin{frame}

\begin{definition}
  $\lambda$-矩阵$A(\lambda)$的非$1$的不变因子的初等因子（相同的必须按出现的次数计）称为该矩阵的\emph{初等因子}。
  \pause
  数字矩阵 $ A$ (或线性变换 $\mathscr{A}$ ) 的非$1$的不变因子的初等因子 (相同的必须按出现的次数计) 称为矩阵 $ A$ （或线性变换 $\mathscr{A}$）的\emph{初等因子}。（既然允许重复，全部初等因子放在一起我们有时说成是\emph{初等因子组}。）
\end{definition}
\pause
顺便指出，由于$n$阶数字矩阵$A$的所有不变因子的乘积等于其特征多项式，所有初等因子的乘积也等于其特征多项式。

\begin{example}\label{134}
设 $12$ 阶数字矩阵的不变因子是
\[
  \underbrace{1,1, \cdots, 1}_{9 \text{个}},(\lambda-1)^{2},(\lambda-1)^{2}(\lambda+1),(\lambda-1)^{2}(\lambda+1)\left(\lambda^{2}+1\right)^{2} .
\]
\pause
按定义， 它的初等因子有 $7$ 个， 即
\[
  (\lambda-1)^{2},(\lambda-1)^{2},(\lambda-1)^{2}, \lambda+1, \lambda+1,(\lambda-i)^{2},(\lambda+i)^{2},
\]
其中 $(\lambda-1)^{2}$ 出现$3$次， $\lambda+1$ 出现$2$次。
\end{example}

按定义不变因子组决定了初等因子组。实际上，反过来，$\lambda$-矩阵的秩确定时，初等因子组也决定了不变因子组。
从初等因子组得到不变因子组的方法如下。

\end{frame}

\begin{frame}
\begin{lemma}[以例~\ref{120}~说明即可，不必证明]
  \label{11E}
  设$\lambda$-矩阵$A(\lambda)$的秩已知（记为$r$）且全部初等因子已知。
记$A(\lambda)$的不变因子依次为$d_1(\lambda),\cdots,d_r(\lambda)$.
设这些初等因子作为多项式的全部不可约因子为$\lambda-\lambda_1, \cdots, \lambda-\lambda_s$, 
且其中最高次的$\lambda-\lambda_i$的幂为$(\lambda-\lambda_i)^{k_i}$, 
那么$d_r(\lambda)$就是这些最高次的初等因子的乘积：$d_r(\lambda)=\prod_{i=1}^s (\lambda-\lambda_i)^{k_i}$.
如此我们恢复了$d_r(\lambda)$ （把初等因子排个序也许会好找点）。
接着从全部初等因子中划掉这些$d_r(\lambda)$的初等因子（每个只去掉一个），考虑剩下的初等因子，用恢复$d_r(\lambda)$同样的方法恢复$d_{r-1}(\lambda)$.
一直如此操作下去，至到用完所有的初等因子。如果此时我们恢复了$d_r(\lambda), d_{r-1}(\lambda), \cdots, d_{k}(\lambda)$且$k>1$, 那么还没有恢复的不变因子$d_1(\lambda), \cdots, d_{k-1}(\lambda)$都是$1$.
%在全部初等因子中将同一个一次因式 $\lambda-\lambda_{j}$ ($j=1,2, \cdots, s$) 的方幂的那些初等因子按降幂排列， 而且当这些初等因子的个数不足 $r$ 时，就在后面补上适当个数的 $1$, 使得凑成 $r$ 个。 设所得排列为
%\[
%\left(\lambda-\lambda_{j}\right)^{k_{rj}},\left(\lambda-\lambda_{j}\right)^{k_{r-1, j}}, \cdots,\left(\lambda-\lambda_{j}\right)^{k_{1 j}}, \quad j=1,2, \cdots, s .
%\]
%于是令
%\[
%d_{i}(\lambda)=\left(\lambda-\lambda_{1}\right)^{k_{i 1}}\left(\lambda-\lambda_{2}\right)^{k_{i 2}} \cdots\left(\lambda-\lambda_{r}\right)^{k_{i s}}, \quad i=1,2, \cdots, r,
%\]
%则 $d_{1}(\lambda), d_{2}(\lambda), \cdots, d_{r}(\lambda)$ 就是 $ A(\lambda)$ 的不变因子。
\end{lemma}

\begin{example}\label{120}
  假设$\lambda$-矩阵$A(\lambda)$的秩为$3$, 全部初等因子为
  \[
    (\lambda-1)^{2},(\lambda-1)^{2},(\lambda-1)^{3}, \lambda+1, (\lambda+1)^2.
\]
令$A(\lambda)$的不变因子为$d_1(\lambda), d_2(\lambda), d_3(\lambda)$ (其中$d_1(\lambda)\mid d_2(\lambda)\mid d_3(\lambda)$).
那么按照引理~\ref{11E}~可依次恢复$d_3(\lambda), d_2(\lambda), d_1(\lambda)$为：
\begin{align*}
  d_3(\lambda)&= (\lambda-1)^3(\lambda+1)^2,\\
  d_2(\lambda)&= (\lambda-1)^2(\lambda+1).\\
  d_1(\lambda)&= (\lambda-1)^2.
\end{align*}
\end{example}


\end{frame}

\begin{frame}
%  \begin{proof*}[引理~\ref{11E}~的证明]
%  假设秩为$r$的$\lambda$-矩阵 $ A(\lambda)$ 的不变因子为 $d_{1}( \lambda), d_{2}( \lambda), \cdots, d_{r}( \lambda)$. 
%  将 $d_{i}( \lambda)$ ($i=1,2, \cdots, r$) 分解成互不相同的一次因式方幂的乘积：
%\[
%  \begin{aligned}
%    %d_1(\lambda) &= \left(\lambda-\lambda_{1}\right)^{k_{11}}\left(\lambda-\lambda_{2}\right)^{k_{12}} \cdots\left(\lambda-\lambda_{s}\right)^{k_{1 s}}, \\
%    %d_{2}(\lambda) &= \left(\lambda-\lambda_{1}\right)^{k_{21}}\left(\lambda-\lambda_{2}\right)^{k_{22}} \cdots\left(\lambda-\lambda_{r}\right)^{k_{2 r}}, \\
%    %& \vdots \\
%    %d_{r}(\lambda) &= \left(\lambda-\lambda_{1}\right)^{k_{n 1}}\left(\lambda-\lambda_{2}\right)^{k_{n 2}} \cdots\left(\lambda-\lambda_{s}\right)^{k_{n s}},
%d_{i}(\lambda) &= \left(\lambda-\lambda_{1}\right)^{k_{i 1}}\left(\lambda-\lambda_{2}\right)^{k_{i 2}} \cdots\left(\lambda-\lambda_{s}\right)^{k_{i s}},
%\end{aligned}
%\]
%其中$k_{ij}\geqslant 0$ （允许$k_{ij}=0$是为了统一表达式）。那么满足 $k_{i j} \geqslant 1$ 的那些方幂
%\[
%  \left(\lambda-\lambda_{j}\right)^{k_{i j}}\quad  (i=1,\cdots,r; j=1,\cdots,s)%($k_{i j} \geqslant 1$)
%\]
%就组成 $ A$ 的全部初等因子。 
%\[
%  d_i(\lambda) \mid d_{i+1}(\lambda)\quad (i=1,\cdots,r-1)
%\]
%表明
%\[
%\left(\lambda-\lambda_{j}\right)^{k_{i j}} \Big\vert\left(\lambda-\lambda_{j}\right)^{k_{i+1, j}}, \quad i=1,2, \cdots, r-1 ; j=1,2, \cdots, s.
%\]
%因此， 在 $d_{1}(\lambda), d_{2}(\lambda), \cdots, d_{r}(\lambda)$ 的分解式中， 属于同一个一次因式的方幂的指数有递升的性质， 即
%\[
%  k_{1 j} \leqslant k_{2 j} \leqslant \cdots \leqslant k_{r j}, \quad j=1,2, \cdots, s.
%\]
%这说明， 同一个一次因式的方幂作成的初等因子中， 方次最高的必定出现在 $d_{n}(\lambda)$ 的分解中， 方次次高的必定出现在 $d_{n-1}(\lambda)$ 的分解中，等等。 
%如此顺推下去， 可知属于同一个一次因式的方幂的初等因子在不变因子的分解式中出现的位置是唯一确定的。
%\end{proof*}

\begin{proof*}[引理~\ref{11E}~的证明]
  先考虑$d_r(\lambda)$. 
  设全部初等因子的所有不可约的因子为$\lambda-\lambda_1,\cdots,\lambda-\lambda_s$.
  再设初等因子中这些一次多项式的最高次幂分别为$(\lambda-\lambda_1)^{k_1},\cdots,(\lambda-\lambda_s)^{k_s}$. 
  固定$1\leqslant j\leqslant s$.  $(\lambda-\lambda_j)^{k_j}$为某个$d_i(\lambda)$ ($1\leqslant i\leqslant r$) 的初等因子，
  从而
  \[
    (\lambda-\lambda_j)^{k_j}\mid d_i(\lambda)\mid d_r(\lambda).
  \]
  这样$\lambda-\lambda_j$作为$d_r(\lambda)$的因子的重数至少为$k_j$, 
  这样此重数只能等于$k_j$, 因为全部初等因子不包含比$k_j$更高的$\lambda-\lambda_j$的次幂。
  进而显然有
  \[
    d_r(\lambda)=(\lambda-\lambda_1)^{k_1}\cdots (\lambda-\lambda_s)^{k_s}.
  \]
  现在从所有初等因子中划去$d_r(\lambda)$的全部初等因子，
  剩下的就是$d_1(\lambda), \cdots, d_{r-1}(\lambda)$的初等因子合并得到的。
  类似地可恢复$d_{r-1}(\lambda)$, 论证也是一样，因为
  \[
    d_1(\lambda)\mid \cdots \mid d_{r-1}(\lambda).
  \]
  如此类似地依次操作下去，至到用完所有的初等因子。
  若还有$d_i(\lambda)$没有恢复，那说明$d_i(\lambda)$没有贡献初等因子，
  故$d_i(\lambda)=1$. 证毕。
\end{proof*}
\end{frame}


\begin{frame}
  数字矩阵的不变因子组与初等因子组相互决定，因为
数字矩阵的特征矩阵的秩就是该数字矩阵的阶。

\begin{example}\label{11F}
  假设$12$阶数字矩阵的初等因子组为
  \[
(\lambda-1)^{2},(\lambda-1)^{2},(\lambda-1)^{2}, \lambda+1, \lambda+1,(\lambda-i)^{2},(\lambda+i)^{2},
\]
设标准形为$\diag(d_1(\lambda), \cdots, d_{12}(\lambda))$.
\pause
那么
\begin{align*}
  d_{12}(\lambda) &= (\lambda-1)^2(\lambda+1)(\lambda-i)^2(\lambda+i)^2= (\lambda-1)^2(\lambda+1)(\lambda^2+1)^2,\\
  d_{11}(\lambda) &= (\lambda-1)^2(\lambda+1),\\
  d_{10}(\lambda) &= (\lambda-1)^2, \\
  d_{9}(\lambda) &= \cdots = d_1(\lambda)=1.
\end{align*}
\end{example}


%由于数字矩阵的全部不变因子的乘积、全部初等因子的乘积都等于其特征多项式，
%我们可以从不变因子组、初等因子组恢复特征矩阵的秩
%（即所有因子的次数之和，当然也等于该数字矩阵的阶）。
%既如此，由上述观察可知，数字矩阵的不变因子组与初等因子组相互决定。
%这样，如果两个同阶的数字矩阵有相同的初等因子组， 
%则它们就有相同的不变因子组， 因而它们相似。 反之， 如果两个矩阵相似， 
%则它们有相同的不变因子组，因而它们有相同的初等因子组。总之，


由定理~\ref{18B}~知
两个同阶复矩阵相似相当于它们有相同的不变因子组。
既然数字矩阵的不变因子组与初等因子组相互决定，我们有
\begin{theorem}
两个同阶复矩阵相似的充要条件是它们有相同的初等因子组。 
\end{theorem}

\end{frame}



\begin{frame}{矩阵直和的初等因子}

  初等因子组好处在于其相对于矩阵的直和行为良好，这是不变因子组不具备的性质。
后面我们会谈数字方阵的相似标准形，会把一个矩阵通过相似变换写成一些简单矩阵的直和，
有时利用初等因子组讨论相似性会更容易。

%\pause
%在证明这个良好的行为之前，我们先来回顾下关于多项式的最大公因式的一个性质（我顺道提了下最小公倍式类似的性质）。
%这个性质由唯一因子分解性是显然的。
%
%\pause
%\begin{observation*}
%给定非零多项式$f_1, \cdots, f_k\in P[x]$, 
%  设$f_i=c_i\prod_{j=1}^n p_j^{r_{ij}}$, 其中$c_i\in P$, 
%  $p_1, \cdots, p_n$是互异的首一不可约多项式，
%  $r_{ij}\geqslant 0$.
%  那么这些$f_i$的最大公因式和最小公倍式分别为
%  \[
%    (f_1, \cdots, f_k) = \prod_{j=1}^n p_j^{s_j},\qquad [f_1, \cdots, f_k] = \prod_{j=1}^n p_j^{t_j},
%  \]
%  其中$s_j = \min\{r_{1j}, \cdots, r_{kj}\}, t_j=\max\{r_{1j}, \cdots, r_{kj}\}$. 
%\end{observation*}
%
%\pause
%\begin{example} 我们有
%\begin{align*}
%  \left( x(x-1)^2(x-4)^2, 3x^2(x-3)^2(x-4)^2, x(x-2)^3(x-4)^4 \right) &=  
%  x(x-4)^2, \\
%    \left[ x(x-1)^2(x-2)^4(x-3), 3x^2(x-3)^2, x(x-2)^3 \right] &= 
%      x^2(x-1)^2(x-2)^4(x-3)^2.
%      \end{align*}
%  \end{example}
%\begin{proof}
%  我们只验证$[f_1, \cdots, f_s] = \prod_{j=1}^n p_j^{t_j}$.
%  只需说明$\prod_{j=1}^n p_j^{t_j}$满足最小公倍式的定义即可。
%  不妨设$t_i>0$, 对每个$i$.
%  显然$f_i\mid \prod_{j=1}^n p_j^{t_j}$, 对任意$i$. 
%  若$f_i\mid h$, 对任意$i$, 由唯一因子分解性可知
%  $p_j^{r_{ij}}\mid h$, 对任意的$i,j$, 从而$p_j^{t_j}\mid h$, 对任意的$j$. 
%  这样$\prod_{j=1}^n p_j^{t_j}\mid h$.
%  故首一多项式$\prod_{j=1}^n p_j^{t_j}$就是$f_1, \cdots, f_s$的首一最小公倍式。
%\end{proof}


%\end{frame}




%\begin{frame}

%下面的定理给了我们一个求初等因子的方法，它不必事先知道不变因子。

\pause
\begin{theorem}[以例~\ref{159}~解释即可，不必再证明]\label{157}
  令$h_1(\lambda),\cdots,h_s(\lambda)$是非零多项式。
  $\lambda$-矩阵$A(\lambda)=\begin{pmatrix}
    h_1(\lambda) \\ & h_2(\lambda) \\ && \ddots \\ &&& h_s(\lambda) \\ &&&&   0
  \end{pmatrix}$的初等因子组可由$h_1(\lambda), \cdots, h_s(\lambda)$的初等因子组合并得到
  (忽略这些$h_i(\lambda)$中的常数多项式)。
  \label{158}
\end{theorem}

\pause
  \begin{corollary}\label{100}
  设$A(\lambda)=\begin{pmatrix}
    A_1(\lambda) \\ & A_2(\lambda) \\ && \ddots \\ &&& A_k(\lambda)
  \end{pmatrix}$, 其中$A_1(\lambda), A_2(\lambda), \cdots, A_k(\lambda)$是任意的$\lambda$-矩阵，
  那么$A(\lambda)$的初等因子组可由$A_1(\lambda), A_2(\lambda), \cdots, A_k(\lambda)$的初等因子组合并得到。
  \label{12E}
\end{corollary}


\end{frame}

\begin{frame}




  \begin{example}\label{159}
  考虑$\lambda$-矩阵
  \[
    A(\lambda)=\begin{pmatrix}
      \lambda(\lambda+ 1)^2(\lambda+2)^2 \\ & \lambda(\lambda+2)^2 \\ & & (\lambda+1)^2(\lambda+2)^3
      \end{pmatrix}.
    \]
    所给矩阵的秩为$3$, 全部初等因子为$\lambda, (\lambda+1)^2, (\lambda+2)^2, \lambda, (\lambda+2)^2, (\lambda+1)^2, (\lambda+2)^3$. 
    \pause
  这样不变因子为
  \[
    d_3(\lambda) = \lambda(\lambda+1)^2 (\lambda+2)^3, \quad d_2(\lambda)= \lambda(\lambda+1)^2(\lambda+2)^2, \quad d_1(\lambda)=(\lambda+2)^2.
  \]
  所以标准形为
  \[
    \begin{pmatrix}
      (\lambda+2)^2 \\ & \lambda(\lambda+1)^2(\lambda+2)^2 \\  & &\lambda(\lambda+1)^2 (\lambda+2)^3
    \end{pmatrix}.
  \]
\end{example}

\pause
\begin{exercise}
  讨论$a,b$取何值时$A=\begin{pmatrix}
    0 & 0 & a \\
    1 & 1 & 0 \\
    1 & 0 & 0
  \end{pmatrix}$与$B=\begin{pmatrix}
    0 & 0  & a^2 \\ 0  & b & 0\\ 1 & 0 & 0 
  \end{pmatrix}$这两个数字矩阵相似。
\end{exercise}


\end{frame}

\begin{frame}
  \begin{proof*}[定理~\ref{157}~的证明]
  令
    \begin{align*}
      h_1 &= c_1 (\lambda-\lambda_1)^{k_{11}} (\lambda-\lambda_2)^{k_{12}} \cdots  (\lambda-\lambda_r)^{k_{1r}},\\
      & \vdots\\
      h_{s} &= c_s (\lambda-\lambda_1)^{k_{s1}} (\lambda-\lambda_2)^{k_{s2}} \cdots  (\lambda-\lambda_r)^{k_{sr}}
  \end{align*}
  分别为$h_1, \cdots, h_r$的不可约分解，其中所有的$k_{ij}\geqslant 0$. 
  \pause
  我们先看$\lambda-\lambda_1$的幂，不妨设
  \[
    k_{11} \leqslant k_{21} \leqslant \cdots \leqslant k_{s1}
  \]
  （必要时置换$A(\lambda)$的行、列），于是可知$A(\lambda)$的$l$阶行列式因子$D_l$ 
  ($1\leqslant l\leqslant s$) 中$\lambda-\lambda_1$的幂的因子为
  \[
    (\lambda-\lambda_1)^{k_{11}+\cdots+k_{l1}}.
  \]
  \pause
  这也就定出了不变因子$d_l(\lambda)=D_l/D_{l-1}$ ($l=1,\cdots,s$, 令$D_0=1$) 
  中$\lambda-\lambda_1$的幂的因子为
    \[
    (\lambda-\lambda_1)^{k_{l1}}.
  \]
  \pause
  故 $A(\lambda)$的初等因子中为$\lambda-\lambda_1$的幂的恰为
  \[
    (\lambda-\lambda_1)^{k_{11}}, \cdots, (\lambda-\lambda_1)^{k_{s1}}
  \]
  （忽略那些等于$1$的）。
\pause
  同样地可决定初等因子中$\lambda-\lambda_2, \cdots, \lambda-\lambda_r$的幂。
  \pause
  进而可知$A(\lambda)$的初等因子恰可由$h_1, \cdots, h_s$的初等因子合并得到。
\end{proof*}

\end{frame}

\begin{frame}
\begin{proof*}[推论~\ref{100}~的证明]
  设$A_i(\lambda)$ 的标准形为
  $\diag(d_{i1}(\lambda),\cdots,d_{ir_i}(\lambda)) \oplus 0.$
  \pause
易知$A(\lambda)=A_1(\lambda) \oplus \cdots \oplus A_k(\lambda)$等价于
\[
  \left(\begin{array}{cc|cc|cc}
    \diag(d_{11}(\lambda),\cdots,d_{1r_1}(\lambda)) & & & &  \\ & 0 & & & \\
    \hline
    & & \ddots & &  \\ 
& & &\ddots & &  \\ 
    \hline
&&&&  \diag(d_{k1}(\lambda),\cdots,d_{kr_k}(\lambda)) &  \\ &&&&  & 0
  \end{array}\right),
\]
\pause
接着做分块的初等变换可知$A(\lambda)$等价于
\[
\begin{aligned}
  A'(\lambda) &= \begin{pmatrix}
  \diag(d_{11}(\lambda),\cdots,d_{1r_1}(\lambda)) \\
    & \ddots \\ 
    && \ddots \\
    &&& \diag(d_{k1}(\lambda),\cdots,d_{kr_k}(\lambda)) \\
    & && & 0
    \end{pmatrix}\\
    &= \diag(d_{11}(\lambda),\cdots,d_{1r_1}(\lambda), \cdots, \cdots, d_{k1}(\lambda),\cdots,d_{kr_k}(\lambda))\oplus 0.
  \end{aligned}
\]
\pause
由定理~\ref{157}~知$A'(\lambda)$的初等因子组是这些$d_{ij}(\lambda)$ ($1\leqslant i\leqslant k, 1\leqslant j\leqslant r_i$) 的初等因子组的合并。
因此$A(\lambda)$的初等因子组可由$A_1(\lambda),\cdots,A_k(\lambda)$的初等因子组合并得到。
\end{proof*}



\end{frame}


\begin{frame}{小结}
  \begin{enumerate}
    \item 何为$\lambda$-矩阵的初等因子？如何从初等因子组恢复不变因子组？
      \pause
    \item 我们有哪些复数域上的数字矩阵相似的刻画？
      \pause
    \item 矩阵的直和的初等因子组可如何获得？
  \end{enumerate}
\end{frame}
